程序体积优化的十个小妙招

Original 程序喵大人程序喵大人 2022-08-22

收录于合集

#性能优化 18 个

#C++ 95 个

#C++精进之路 122 个

大家好，我是程序喵，众所周知，前两天，小破站又上市了，慷慨的宣布要给员工加鸡腿，激动的喵哥一夜没睡好，万万妹想到啊，人算不如天算，公司真的发了鸡腿，没错，就是你想的那个。

鸡腿啥的不想了，我还是安心肝文章吧。。。

前一段时间在知乎上看到个问题：Linux如何优化可执行程序的体积？

在我们的日常工作中，一般对程序的体积都有严格的要求，有时候仅仅因为几字节的代码段体积或者多了几十毫秒的运行时间，整个项目就达不到验收标准，甚至不能成功上线。这里我抛砖引玉先提出几个思路，大家如果有好的优化策略欢迎打在评论区。

大体思路有这些：

好好写代码，减小代码段体积，别人300代码的逻辑我们50行搞定，程序体积肯定有机会更小一些，这个就得考验开发者自己的编程功底了
如果是C++程序，可以尽量减少模板的使用，模板实例化可能会导致代码膨胀
不用引用没有用的头文件
使用strip，像脱衣服一样，移除程序的所有符号，这也是很多开发者常用的方式
strip只会清除普通符号，不会动态符号表中的符号，某些动态符号其实也可以隐藏掉，进而来减小库的体积，可以使用-fvisibility=hidden命令
巧用.bss段，未初始化的全局变量和局部静态变量会存在.bss段中，这些变量不占用程序空间
inline-limit：内联过多会导致代码段体积较大，可以通过此优化选项减少内联的数量
开启Os编译，这是产生较小代码体积的优化选项
适当使用编译选项-fdata-sections和-ffunction-sections
考虑链接动态库而非静态库

以上说的太笼统了？贴心如我早就准备好了，不谢~

strip使用

在Linux中可以使用man strip查看strip使用方法，最主要的就是移除所有符号的-s参数，用于清除所有的符号信息：

strip -s xxx

在使用strip之前先使用nm查看下可执行程序的符号信息：

~/test$ nm a.out0000000000200da0 d _DYNAMIC0000000000200fa0 d _GLOBAL_OFFSET_TABLE_000000000000089b t _GLOBAL__sub_I__Z4funcPc0000000000000930 R _IO_stdin_usedw _ITM_deregisterTMCloneTablew _ITM_registerTMCloneTable0000000000000852 t _Z41__static_initialization_and_destruction_0ii00000000000007fa T _Z4funcPc000000000000081c T _Z4funciU _ZNSt8ios_base4InitC1Ev@@GLIBCXX_3.4U _ZNSt8ios_base4InitD1Ev@@GLIBCXX_3.40000000000201020 B _ZSt4cout@@GLIBCXX_3.40000000000000934 r _ZStL19piecewise_construct0000000000201131 b _ZStL8__ioinitU _ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc@@GLIBCXX_3.40000000000000b24 r __FRAME_END__0000000000000940 r __GNU_EH_FRAME_HDR0000000000201010 D __TMC_END__0000000000201010 B __bss_startU __cxa_atexit@@GLIBC_2.2.5w __cxa_finalize@@GLIBC_2.2.50000000000201000 D __data_start00000000000007b0 t __do_global_dtors_aux0000000000200d98 t __do_global_dtors_aux_fini_array_entry0000000000201008 D __dso_handle0000000000200d88 t __frame_dummy_init_array_entryw __gmon_start__0000000000200d98 t __init_array_end0000000000200d88 t __init_array_start0000000000000920 T __libc_csu_fini00000000000008b0 T __libc_csu_initU __libc_start_main@@GLIBC_2.2.50000000000201010 D _edata0000000000201138 B _end0000000000000924 T _fini0000000000000688 T _init00000000000006f0 T _start0000000000201130 b completed.76980000000000201000 W data_start0000000000000720 t deregister_tm_clones00000000000007f0 t frame_dummy000000000000083d T main0000000000000760 t register_tm_clones

当前这个可执行程序的文件大小是8840字节：

-rwxrwxrwx 1 a a 8840 Nov 29 14:54 a.out

使用strip清除符号信息：

~/test$ strip -s a.out

strip后再查看可执行文件的符号信息：

~/test$ nm a.out nm: a.out: no symbols

发现什么符号都没有了，但还是可以执行。

strip后的可执行程序文件大小是6120字节：

-rwxrwxrwx 1 a a 6120 Nov 29 14:54 a.out

具体可以看我这篇文章：《Linux有一个命令你一定要知道》

-fvisibility=hidden可以这样使用：

$ g++ -fvisibility=hidden -c layer.cxx -o layer.o

具体可以看：《硬核好文：原来编译链接还有这么多套路》

巧用.bss段：

看下面代码：

#include <stdio.h>

int a[1000];int b[1000] = {1};

int main() { printf("程序喵\n"); return 0;}

我们查看下文件大小和各个段大小：

$ gcc testlink.c -o test$ ls -l test-rwxrwxrwx 1 wzq wzq 12368 May 30 08:48 test$ size testtext data bss dec hex filename1512 4616 4032 10160 27b0 test

再看这段初始化的代码：

#include <stdio.h>

int a[1000] = {1};int b[1000] = {1};

int main() { printf("程序喵\n"); return 0;}

再查看下文件大小和各个段大小：

$ gcc testlink.c -o test$ ls -l test-rwxrwxrwx 1 wzq wzq 16368 May 30 08:49 test$ size testtext data bss dec hex filename1512 8616 8 10136 2798 test

可以看到仅仅是做了一次初始化，文件大小就从12368变成了16368，正好是初始化了的那a[1000]的大小，这4000字节从.bss段移动到了.data段，程序大小增加了，这里可以看出.bss段不占据磁盘空间。

具体可以看：《谈谈程序链接及分段那些事》

巧用-fdata-sections和-ffunction-sections：

现在的程序和库通常来讲都很大，一个目标文件可能包含成百上千个函数或变量，当需要用到某个目标文件的任意一个函数或变量时，就需要把它整个目标文件都链接进来，也就是说那些没有用到的函数也会被链接进去，这会导致链接输出文件变的很大，造成空间浪费。

有一个编译选项叫函数级别链接，可以使得某个函数或变量单独保存在一个段里面，都链接器需要用到某个函数时，就将它合并到输出文件中，对于没用到的函数则将他们抛弃，减少空间浪费，但这会减慢编译和链接过程，GCC编译器的编译选项是：

-ffunction-sections -fdata-sections

具体可以看：《程序一定要从main函数开始运行吗？》

最后，大家有什么好的优化策略欢迎在留言区留言。

往期推荐

1、少写点

if-else吧，它的效率有多低你知道吗？

2、年度原创好文汇总